歡迎來到這個為期 30 天的實戰計畫!目標是從零開始,打造一個功能強大的「多模態記憶型 Agent」。這個 Agent 不僅能看懂圖片,還能與你進行深入的對話,並將對話內容結構化地記憶下來。
首先第一步,會先參考以下優秀的教學影片與文件,快速做出一個最小可行性的 Demo。在有了基本框架後,我們再逐步拆解、加深,探討每個技術細節,最終完成一個功能完備的智慧助理。
在這 30 天的旅程結束時,將會完成一個功能完整的 App,它具備以下核心能力:
將正式進入 Default 製作 (2/5):依照參考影片,拉起一個端到端的 Demo,並導入 LiveKit、STT 與 TTS。